Εξόρυξη Γνώσης και Μηχανική Μάθηση

Κωδικός μαθήματος
ΨΣ026
Μονάδες ECTS
6
Εξάμηνο
Εξάμηνο ΣΤ
Κατηγορία μαθήματος
Περιγραφή μαθήματος
ΜΑΘΗΣΙΑΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ

Το μάθημα αποσκοπεί στην εμβάθυνση των φοιτητών/τριών στις βασικές έννοιες, τεχνικές και εφαρμογές της Εξόρυξης Γνώσης από ∆εδομένα και της Μηχανικής Μάθησης. Με την επιτυχή ολοκλήρωσή του, οι φοιτητές/τριες θα είναι σε θέση να:

  • Αναγνωρίζουν και περιγράφουν τα βασικά στάδια της διαδικασίας εξόρυξης γνώσης (Knowledge Discovery in Databases – KDD) και τις εφαρμογές της σε πραγματικά προβλήματα.
  • Εφαρμόζουν τεχνικές προεπεξεργασίας δεδομένων, όπως καθαρισμό, κανονικοποίηση και επιλογή χαρακτηριστικών, για τη σωστή προετοιμασία συνόλων δεδομένων.
  • Κατανοούν τη λειτουργία και τα βασικά χαρακτηριστικά αλγορίθμων ταξινόμησης (επιβλεπόμενη μάθηση), ομαδοποίησης (μη επιβλεπόμενη μάθηση) και εξαγωγής κανόνων συσχέτισης.
  • Συνδυάζουν μεθόδους μηχανικής μάθησης και εξόρυξης γνώσης για τη βελτιστοποίηση της ακρίβειας, της γενίκευσης και της αποδοτικότητας μοντέλων.
  • Αξιολογούν την απόδοση των αλγορίθμων μέσω κατάλληλων τεχνικών επικύρωσης (cross-validation) και δεικτών αξιολόγησης (π.χ., precision, recall, F1-score).
  • Εφαρμόζουν αρχές ερμηνεύσιμης μηχανικής μάθησης (interpretable machine learning) για την κατανόηση των αποτελεσμάτων και την ενίσχυση της διαφάνειας.
  • Αναλύουν και συσχετίζουν τεχνικές εξόρυξης γνώσης και μηχανικής μάθησης με εφαρμογές σε τομείς όπως οι επιχειρήσεις, η ιατρική, η κυβερνοασφάλεια και η ανάλυση δεδομένων χρηστών. 
ΓΕΝΙΚΕΣ ΙΚΑΝΟΤΗΤΕΣ
  • Αναζήτηση, ανάλυση και σύνθεση δεδομένων και πληροφοριών, με τη χρήση και των απαραίτητων τεχνολογιών
  • Λήψη αποφάσεων
  • Αυτόνομη ή και ομαδική εργασία
  • Προαγωγή της ελεύθερης, δημιουργικής και επαγωγικής σκέψης
ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

Σύντομη περιγραφή

  • Εισαγωγή στην εξόρυξη γνώσης και τη μηχανικής μάθηση.
  • Προετοιμασία δεδομένων (Καθαρισμός δεδομένων, διαχείριση απούσων τιμών, επιλογή χαρακτηριστικών, διακριτοποίηση, διαχείριση ανισοκατανομών σε προβλήματα κατηγοριοποίησης κ.α.)
  • Εισαγωγή στην κατηγοριοποίηση/εποπτευμένη μάθηση, Κατηγορίες αλγορίθμων κατηγοριοποίησης, Αλγρόριθμοι που βασίζονται σε πιθανότητες (π.χ. naive bayes), Αλγόριθμοι που βασίζονται στον διαχωρισμό του χώρου (π.χ. ∆ένδρα αποφάσεων), Αλγόριθμοι που βασίζονται στην ομοιότητα/απόσταση (κ εγγύτεροι γείτονες), αποτελεσματική αναζήτηση εγγύτερων γειτόνων μέσω δεικτοδότησης δεδομένων (π.χ. kdtree), τεχνικές μείωσης δεδομένων εκπαίδευσης.
  • Εισαγωγή στην συσταδοποίησης/μη εποπτευμένη μάθηση, Αλγόριθμοι Συσταδοποίησης: Ο αλγόριθμος κ μέσων (k-means) και οι παραλλαγές του, Ιεαραρχική συσταδοποίηση, συσταδοποίηση βάσει πυκνότητας (DBSCAN), τεχνικές προσδιορισμου παραμέτρων
  • Μέτρηση της απόδοσης αλγορίθμων κατηγοριοποίησης και συσταδοποίησης
  • Κανόνες συσχέτισης, Ο αλγόριθμος Apriori για την ανακάλυψη κανώνων συσχέτισης, μέτρα αξιολόγησης των κανόνων συσχέτισης
  • Επεξεργασία τύπου OLTP και OLAP, σχεδίαση και υλοποίηση Αποθήκης ∆εδομένων, σχήμα αστέρα και χιονονιφάδας, διαδικασίες Extract-Transform-Load (ETL), πολυδιάστατοι κύβοι δεδομένων, αίτηματα OLAP και αλγόριθμοι εξόρυξης γνώσης σε κύβους δεδομένων.
ΟΡΓΑΝΩΣΗ ΔΙΔΑΣΚΑΛΙΑΣ
Δραστηριότητα Φόρτος Εργασίας Εξαμήνου
Διαλέξεις 39
Φροντιστηριακή διδασκαλία 13
Αυτοτελής μελέτη 98
Σύνολο μαθήματος 150
ΑΞΙΟΛΟΓΗΣΗ ΦΟΙΤΗΤΩΝ

Το μάθημα αξιολογείται με γραπτή τελική εξέταση δίωρης διάρκειας, και πιθανή διαδικασία διαρκούς αξιολόγησης κατά την κρίση του διδάσκοντα. Η ακριβής διαδικασία αξιολόγησης ανακοινώνεται στους φοιτητές και αναρτάται στο eclass στην αρχή του εξαμήνου.

ΣΥΝΙΣΤΩΜΕΝΗ ΒΙΒΛΙΟΓΡΑΦΙΑ

1. Margaret H. Dunham, Data Mining, Εκδόσεις Νέων Τεχνολογιών, , 2004 (κωδικός στον Εύδοξο: 395)
2. Pang - Ning Tan, Michael Steinbach, Anuj Karpatne, Vipin Kumar, Βασίλειος Βερύκιος (επιμέλεια), Εισαγωγή στην Εξόρυξη ∆εδομένων, 2η Έκδοση, Εκδόσεις Τζιόλα,, 2018 (κωδικός στον Εύδοξο: 77107675)
3. Mohammed J. Zaki και Wagner Meira Jr., Εξόρυξη και Ανάλυση ∆εδομένων: Βασικές Έννοιες και Αλγόριθμοι, Εκδόσεις Κλειδάριθμος, , 2017 (κωδικός στον Εύδοξο: 68386089)
4. Anand Rajaraman, Jeffrey David Ullman, και Jure Leskovec, Εξόρυξη από Μεγάλα Σύνολα ∆εδομένων, Εκδόσεις Νέων Τεχνολογιών, , 2020 (κωδικός στον Εύδοξο: 94700707)
5. Αλ. Νανόπουλος και Γ. Μανωλόπουλος, Εισαγωγή στην Εξόρυξη ∆εδομένων και τις Αποθήκες ∆εδομένων, Εκδόσεις Νέων Τεχνολογιών, , 2008 (κωδικός στον Εύδοξο: 3079)

ΗΛΕΚΤΡΟΝΙΚΗ ΣΕΛΙ∆Α ΜΑΘΗΜΑΤΟΣ ΣΤΟ ECLASS

https://eclass.uop.gr/modules/auth/opencourses.php?fc=294